Sekuentzien lerrokatze

Sekuentzien lerrokatzea bioinformatikako arloan bi edo gehiago diren DNA, RNA edo egitura proteiko primarioen sekuentziak elkarren artean konparatzeko edo irudikatzeko era bat da. Helburua da sekuentzia hauetan komunak diren zatiak nabarmentzea, erlazio funtzional edo ebolutiboak adieraz dezaketenak. Sekuentzia hauek matrize baten lerroetan irudikatzen dira hizkien bitartez (aminoazidoak edo nukleotidoak irudikatuz). Beharrezkoa bada, zuriuneak gehitzen dira estruktura berdina duten sekuentziak lerroka daitezen.

Nahiz eta DNA eta RNAko oinarri nukleotidokoak elkarrekiko berdintsuagoak izan aminoazidoekin baino, oinarrien parekatzeen mantentzeak rol funtzional edo estruktura berdintsuak adierazi lezake. Sekuentzien lerrokatzeak biologikoak ez diren sekuentziekin erabili daitezke, hala nola hizki-serie eta gizakien hitzen identifikazioan edo datu finantzarioen analisian. Proteinen estruktura primarioak konparatzeko hainbat algoritmo aurki ditzakegu, baina nabarmengarrienak Needleman-Wunch algoritmoa, Smith-Waterman algoritmoa, BLAST eta FASTA dira.

Oso motzak edo oso berdintsuak diren sekuentziak eskuz lerrokatu daitezke. Bestalde, problema interesgarrienak eskuz lerrokatu ezin daitezken sekuentzia oso luze, aldagarriak eta oso ugariak erabiltzera behartzen dute. Gizakien adimena kalitatezko lerrokatzeak sortuko dituzten algoritmoak sortzeko erabiltzen da, eta batzuetan azkeneko emaitza estutzeko, algoritmoetan sartzeko oso zailak diren patroiak errepresentatzeko. Hurbilpen konputazionalak bi kategorietan banatzen dira: lerrokatze globala eta lerrokatze lokala. Lerrokatze globala kalkulatzea, optimizazio global mota bat da, lerrokatzeari sartutako sekuentzien luzera osoa okupatzera behartzen diona. Konparatiboki, lerrokatze lokalak sekuentzia luzeetako sekzio berdintsuak identifikatzen dituzte, sekuentzia hauek askotan dibergenteak dira haien artean. Askotan lerrokatze lokalak gehiago aukeratzen dira, baina zailagoak izan daitezke berdintasun erregio hauen identifikazioa gehitu behar zaielako. Sekuentzien lerrokatzeari hainbat algoritmo konputazional aplikatzen dira, hala nola metodo motelak, baina optimizatzeko erabiliak, programazio dinamikoa eta metodo heuristiko edo probabilistiko eraginkorrak, datu-base handietan bilatzeko pentsatuak daudenak.


© MMXXIII Rich X Search. We shall prevail. All rights reserved. Rich X Search